Технологии перевода жестовых языков | Лиза Петрова, SberDevices
Description
Как современные технологии делают доступнее мир для слабослышащих людей? 🫰🏻 В новом выпуске подкаста мы встретились с Лизой Петровой — Computer Vision инженером из SberDevices. Лиза и ее команда занимаются задачами, связанными с компьютерным зрением и автоматической обработкой жестовых языков.
Выпуск получился очень интересным! Мы обсудили:
📍Как собирались и готовились данные для самого большого датасета для распознавания РЖЯ
📍Важно ли разработчикам знать жестовый язык, чтобы делать state-of-the-art модели
📍Как команде удалось создать лучшую в мире модель по распознаванию американского жестового языка
Ведущая, продюсер: Мария Бочарова
Монтажер: Андрей Чиркин
🎧 Подписывайтесь на нас в соц. сетях:
t.me/lingvo_podcast
vk.com/lingvopodcast
📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Таймкоды:
0:42 Путь Лизы в Data Science и карьера в SberDevice
4:14 Проекты R&D команды SberDevices: HaGRID, Slovo, EasyPortrait. Что такое face parsing, матирование, гармонизация
9:05 Инклюзия. Потребность в распознавании РЖЯ
11:30 Корректные обращения к слабослыщащим
12:46 Датасет Slovo – как он создавался и какие были проблемы
22:12 Изучение РЖЯ раКак современные технологии делают доступнее мир для слабослышащих людей? 🫰🏻
24:45 Лучшая в мире модель по распознаванию американского жестокого языка SignFlow
27:12 Как ML-модели работают с видео
30:48 План развития: непрерывная речь, перевод, контекст
33:43 Первый в мире открытый датасет РЖЯ и аналоги в других стран
35:56 Результаты обучения модели
37:29 Потенциал продукта
39:29 Будущее сурдопереводчиков
40:00 Мотивация работать в индустрии